<!DOCTYPE html>
<html lang="en">
<head>
	<meta charset="UTF-8">
	<meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
	<title>cross-fields 跨字段查询 | Elasticsearch: 权威指南 | Elastic</title>
    <!-- Give IE8 a fighting chance -->
    <!--[if lt IE 9]>
    <script src="https://oss.maxcdn.com/html5shiv/3.7.2/html5shiv.min.js"></script>
    <script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
    <![endif]-->
	<link rel="stylesheet" type="text/css" href="../static/styles.css" />
</head>
<body>
<div class="main-container">
    <section id="content">
        
        <div class="content-wrapper">
            <section id="guide" lang="zh_cn">
                <div class="container">
                    <div class="row">
                        <div class="col-xs-12 col-sm-8 col-md-8 guide-section">
                            <div style="color:gray; word-break: break-all; font-size:12px;">原文地址: <a href="https://www.elastic.co/guide/cn/elasticsearch/guide/current/_cross_fields_queries.html" rel="nofollow">https://www.elastic.co/guide/cn/elasticsearch/guide/current/_cross_fields_queries.html</a>, 版权归 www.elastic.co 所有<br/>
                            英文版地址: <a href="https://www.elastic.co/guide/en/elasticsearch/guide/current/_cross_fields_queries.html" rel="nofollow">https://www.elastic.co/guide/en/elasticsearch/guide/current/_cross_fields_queries.html</a>
                            </div>
                        <!-- start body -->
                  <div class="page_header">
<b>请注意:</b><br>本书基于 Elasticsearch 2.x 版本，有些内容可能已经过时。
</div>
<div id="content">
<div class="breadcrumbs">
<span class="breadcrumb-link"><a href="index.html">Elasticsearch: 权威指南</a></span>
»
<span class="breadcrumb-link"><a href="search-in-depth.html">深入搜索</a></span>
»
<span class="breadcrumb-link"><a href="multi-field-search.html">多字段搜索</a></span>
»
<span class="breadcrumb-node">cross-fields 跨字段查询</span>
</div>
<div class="navheader">
<span class="prev">
<a href="custom-all.html">« 自定义 _all 字段</a>
</span>
<span class="next">
<a href="_exact_value_fields.html">Exact-Value 精确值字段 »</a>
</span>
</div>
<div class="section">
<div class="titlepage"><div><div>
<h2 class="title">
<a id="_cross_fields_queries"></a>cross-fields 跨字段查询<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/110_Multi_Field_Search/50_Cross_field.asciidoc">edit</a>
</h2>
</div></div></div>
<p>自定义 <code class="literal">_all</code> 的方式是一个好的解决方案，只需在索引文档前为其设置好映射。不过， Elasticsearch 还在搜索时提供了相应的解决方案：使用 <code class="literal">cross_fields</code> 类型进行 <code class="literal">multi_match</code> 查询。 <code class="literal">cross_fields</code> 使用词中心式（term-centric）的查询方式，这与 <code class="literal">best_fields</code> 和 <code class="literal">most_fields</code> 使用字段中心式（field-centric）的查询方式非常不同，它将所有字段当成一个大字段，并在 <em>每个字段</em> 中查找 <em>每个词</em> 。</p>
<p>为了说明字段中心式（field-centric）与词中心式（term-centric）这两种查询方式的不同，先看看以下字段中心式的 <code class="literal">most_fields</code> 查询的 <code class="literal">explanation</code> 解释：</p>
<div class="pre_wrapper lang-sense">
<pre class="programlisting prettyprint lang-sense">GET /_validate/query?explain
{
    "query": {
        "multi_match": {
            "query":       "peter smith",
            "type":        "most_fields",
            "operator":    "and", <a id="CO78-1"></a><i class="conum" data-value="1"></i>
            "fields":      [ "first_name", "last_name" ]
        }
    }
}</pre>
</div>
<div class="sense_widget" data-snippet="snippets/110_Multi_Field_Search/50_Cross_field.json"></div>
<div class="calloutlist">
<table border="0" summary="Callout list">
<tr>
<td align="left" valign="top" width="5%">
<p><a href="#CO78-1"><i class="conum" data-value="1"></i></a></p>
</td>
<td align="left" valign="top">
<p>所有词都是必须的。</p>
</td>
</tr>
</table>
</div>
<p>对于匹配的文档， <code class="literal">peter</code> 和 <code class="literal">smith</code> 都必须同时出现在相同字段中，要么是 <code class="literal">first_name</code> 字段，要么 <code class="literal">last_name</code> 字段：</p>
<pre class="literallayout">(+first_name:peter +first_name:smith)
(+last_name:peter  +last_name:smith)</pre>

<p><em>词中心式</em> 会使用以下逻辑：</p>
<pre class="literallayout">+(first_name:peter last_name:peter)
+(first_name:smith last_name:smith)</pre>

<p>换句话说，词 <code class="literal">peter</code> 和 <code class="literal">smith</code> 都必须出现，但是可以出现在任意字段中。</p>
<p><code class="literal">cross_fields</code> 类型首先分析查询字符串并生成一个词列表，然后它从所有字段中依次搜索每个词。这种不同的搜索方式很自然的解决了 <a class="xref" href="field-centric.html" title="字段中心式查询">字段中心式</a> 查询三个问题中的二个。剩下的问题是逆向文档频率不同。</p>
<p>幸运的是 <code class="literal">cross_fields</code> 类型也能解决这个问题，通过 <code class="literal">validate-query</code> 可以看到：</p>
<div class="pre_wrapper lang-sense">
<pre class="programlisting prettyprint lang-sense">GET /_validate/query?explain
{
    "query": {
        "multi_match": {
            "query":       "peter smith",
            "type":        "cross_fields", <a id="CO79-1"></a><i class="conum" data-value="1"></i>
            "operator":    "and",
            "fields":      [ "first_name", "last_name" ]
        }
    }
}</pre>
</div>
<div class="sense_widget" data-snippet="snippets/110_Multi_Field_Search/50_Cross_field.json"></div>
<div class="calloutlist">
<table border="0" summary="Callout list">
<tr>
<td align="left" valign="top" width="5%">
<p><a href="#CO79-1"><i class="conum" data-value="1"></i></a></p>
</td>
<td align="left" valign="top">
<p>用 <code class="literal">cross_fields</code> 词中心式匹配。</p>
</td>
</tr>
</table>
</div>
<p>它通过 <em>混合</em> 不同字段逆向索引文档频率的方式解决了词频的问题：</p>
<pre class="literallayout">+blended("peter", fields: [first_name, last_name])
+blended("smith", fields: [first_name, last_name])</pre>

<p>换句话说，它会同时在 <code class="literal">first_name</code> 和 <code class="literal">last_name</code> 两个字段中查找 <code class="literal">smith</code> 的 IDF ，然后用两者的最小值作为两个字段的 IDF 。结果实际上就是 <code class="literal">smith</code> 会被认为既是个平常的姓，也是平常的名。</p>
<div class="note admon">
<div class="icon"></div>
<div class="admon_content">
<p>为了让 <code class="literal">cross_fields</code> 查询以最优方式工作，所有的字段都须使用相同的分析器，具有相同分析器的字段会被分组在一起作为混合字段使用。</p>
<p>如果包括了不同分析链的字段，它们会以 <code class="literal">best_fields</code> 的相同方式被加入到查询结果中。例如：我们将 <code class="literal">title</code> 字段加到之前的查询中（假设它们使用的是不同的分析器）， explanation 的解释结果如下：</p>
<pre class="literallayout">(+title:peter +title:smith)
(
  +blended("peter", fields: [first_name, last_name])
  +blended("smith", fields: [first_name, last_name])
)</pre>

<p>当在使用 <code class="literal">minimum_should_match</code> 和 <code class="literal">operator</code> 参数时，这点尤为重要。</p>
</div>
</div>
<div class="section">
<div class="titlepage"><div><div>
<h3 class="title">
<a id="_按字段提高权重"></a>按字段提高权重<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/110_Multi_Field_Search/50_Cross_field.asciidoc">edit</a>
</h3>
</div></div></div>
<p>采用 <code class="literal">cross_fields</code> 查询与 <a class="xref" href="custom-all.html" title="自定义 _all 字段">自定义 <code class="literal">_all</code> 字段</a> 相比，其中一个优势就是它可以在搜索时为单个字段提升权重。</p>
<p>这对像 <code class="literal">first_name</code> 和 <code class="literal">last_name</code> 具有相同值的字段并不是必须的，但如果要用 <code class="literal">title</code> 和 <code class="literal">description</code> 字段搜索图书，可能希望为 <code class="literal">title</code> 分配更多的权重，这同样可以使用前面介绍过的 <code class="literal">^</code> 符号语法来实现：</p>
<div class="pre_wrapper lang-js">
<pre class="programlisting prettyprint lang-js">GET /books/_search
{
    "query": {
        "multi_match": {
            "query":       "peter smith",
            "type":        "cross_fields",
            "fields":      [ "title^2", "description" ] <a id="CO80-1"></a><i class="conum" data-value="1"></i>
        }
    }
}</pre>
</div>
<div class="calloutlist">
<table border="0" summary="Callout list">
<tr>
<td align="left" valign="top" width="5%">
<p><a href="#CO80-1"><i class="conum" data-value="1"></i></a></p>
</td>
<td align="left" valign="top">
<p><code class="literal">title</code> 字段的权重提升值为 <code class="literal">2</code> ， <code class="literal">description</code> 字段的权重提升值默认为 <code class="literal">1</code> 。</p>
</td>
</tr>
</table>
</div>
<p>自定义单字段查询是否能够优于多字段查询，取决于在多字段查询与单字段自定义 <code class="literal">_all</code> 之间代价的权衡，即哪种解决方案会带来更大的性能优化就选择哪一种。</p>
</div>

</div>
<div class="navfooter">
<span class="prev">
<a href="custom-all.html">« 自定义 _all 字段</a>
</span>
<span class="next">
<a href="_exact_value_fields.html">Exact-Value 精确值字段 »</a>
</span>
</div>
</div>

                  <!-- end body -->
                        </div>
                        <div class="col-xs-12 col-sm-4 col-md-4" id="right_col">
                        
                        </div>
                    </div>
                </div>
            </section>
        </div>
    </section>
</div>
<script src="../static/cn.js"></script>
</body>
</html>